统计机器翻译:一种机器翻译方法,通过对大量双语语料进行概率统计建模来生成译文,常见做法是把翻译看作“在所有可能译文中选择概率最高的那个”。(该术语也常与基于规则的翻译、神经机器翻译并列讨论。)
Statistical machine translation uses large bilingual corpora to learn how to translate.
统计机器翻译利用大量双语语料来学习如何翻译。
Before neural models became dominant, statistical machine translation was the standard approach in many commercial translation systems because it was relatively effective and interpretable.
在神经模型成为主流之前,统计机器翻译曾是许多商业翻译系统的标准方案,因为它相对有效且更容易解释。
/stəˈtɪstɪkəl məˈʃiːn trænzˈleɪʃən/
该短语由三部分构成:statistical(统计的) + machine(机器的,指计算机系统) + translation(翻译)。其核心思想源于20世纪后期信息论与概率建模在自然语言处理中的应用;“统计”强调用数据估计语言与翻译的概率规律,而不是依赖人工编写的大量语法规则。